PCT 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITB DE COOPERATION EN MATTERS DE BREVETS (PCT) 



(51) Classification Internationale des brevets 6 : 
C12Q 1/68 



(11) Numcro de publication Internationale: WO 97/30178 
(43) Date de publication Internationale: 21 aout 1997 (21 .08.97) 



(21) Numero de la demande internationale: PCT/FR97/00297 



(22) Date de depSt international: 



17 fevrier 1997 (17.02.97) 



(30) Donnees relatives k la priority 

96/01864 15 fevrier 1996 (15.02.96) 



(71) Deposantfpow tons hs Etais disignis saufUS): FONDATION 

JEAN DAUSSET-CEPH (FR/FRJ; 27, rue Juliette-Dodu, F- 
75010 Paris (FR). 

(72) Inventeurs; et 

(75) Invcntcurs/Deposants (US settlement): NERI, Christian 
fER/FR]; 5, rue des Reculettes, F-75013 Paris (FR). CANN, 
Howard, M. [FR/FRJ; 57, rue de Lille, F-75007 Paris 
(FR). COHEN, Daniel [FR/FR]; 5, avenue Odette, F-94120 
Fontenay-sous-Bois (FR). 

(74) Mandataire: MARTIN, Jean-Jacques; Cabinet Regimbeau, 26, 
avenue Kleber, F-75116 Paris (FR). 



(81) Etats designe's: CA, JP, US, brevet europeen (AT, BE, CH, 
DE, DK, ES, F£, FR, GB, GR, IE, IT, LU, MC, NL, PT, 
SE). 



(54) Title: DIAGNOSING TRINUCLEOTIDE REPEAT DISEASES AND GENES INVOLVED 
(54) Titre: DIAGNOSTIC DES MALADIES A REPETITION TRINUCLEOTIDIQUE ET GENES IMPLIQUES DANS CES MALADIES 
(57) Abstract 

A transcribed DNA sequence with a high level of CAG or CTG repeat codons corresponding to sequences A to I on die table, 
and alleles, and complementary sequences thereof, are disclosed. The sequences are particularly useful for diagnosing trinucleotide repeat 
diseases. 



La presente invention concerns une sdquence d'ADN transcrit et riche en triplet repete CAG ou CTG correspondant aux sequences 
A a I selon le tableau ainsi que leurs alleles et les sequences complemcntaires. Ces sequences sont utiles notamment dans Je diagnostic des 



maladies a nipStitiort trirtucleotidique. 



VNIQVEMENT A TITRE D'INFORMATION 



Codes utilises pour identifier les Etats parties au PCT, sur les pages de couverture des brochures publiant 
des demandes internationales en vertu du PCT. 



AT 




GB 


Royaumc-Uni 




MW 




AT 


Autriche 


GE 


Gforgie 




MX 


Mexique 


AU 




GN 






NE 




BB 
BE 


Betgiqw 


GR 
HO 






NL 
NO 




OF 


Huikina. F»o 


IE 






NZ 


Nouv^le-Zftlande 


BG 




IT 






PL 




BJ 




JP 






PT 




BR 




KE 






RO 


Rouroani* 






KG 


Kirghizisian 




nv 


Federation de Russie 


CA 




KP 


RepuMique popnl 


lire democratique 


SD 




CF 


RtpuMique courafricatrte 




de Corfe 




SB 


Suede 


CG 


Coago 


KR 


Republique de Co 


nee 


SG 


Singapour 


CH 




KZ 


Kazakhstan 




SI 


Sloven ie 


CI 


Cote d'lvoire 


U 


Liechtenstein 




SK 


Siovaquie 


CM 


Cameroim 


VK 


Sri Lanka 




SN 


Senegal 


CN 


Chine 


MM 


Liberia 




sz 


Swaziland 


cs 


Tchicoslovaquie 


Vt 








Tchad 


cz 


R6publique tciifcque 


LU 


Luxcmboutg 




TG 


Togo 




Atlemagne 


LV 






TJ 


Tadjikistan 


OK 




MC 






IT 


Trinite-er-Tobago 


EE 


Ksionie 


MD 


R<[rablit|ue de M« 




UA 




ES 


Espagne 


MG 


Madagascar 




UG 


Ouganda 




Finlande 


ML 


Mali 






Etats-Unis d'Anidriquc 


FR 


France 


MN 


Mongol ie 




UZ 


OuzWkistan 


GA 




MR 


Mauritanie 




VN 


Viet Nam 



WO 97/30178 PCT/FR97/00297 

1 

DIAGNOS TIC PES MALADIES A REPETITION TRWUCLEO TIDIOUE 
ET GENES IMPUOUES DANS CES MALADIES 

La presente invention concerne la mise en evidence de genes 
humains comportant des sequences a triplet repete CAG ou CTG, ainsi que 
5 Futtlisation de ces genes dans le diagnostic et I'eventuel traitement de 
certaines maladies neurologiques hereditaires. 

L'expansion de sequences a triplet repeHe CAG ou CTG 
hautement polymorphiques et instables constitue une mutation impliquee 
dans au moins 6 maLadies neurologiques hereditaires humaines (appelees 
10 "maladies a triplet repete"), notamment l'atrophie musculaire 
spinobttlbaire (SBMA), la dystrophic myotonique (MD), I'ataxie cdrebro- 
spinale (SCAS) I et 3, l'atrophie dentato-rubro-pallydoluysiane (DRPLA) et 
la maladie d'Huntington (HD) (1). 

L'expansion des CAG/CTG (appelee egalement mutation 
15 dynamique) dans chacune de ces maladies est associee a un phenomene 
d'anticipation, la taille des repetitions etant souvent correlee de facon 
inverse avec Page de la survenue et/ou de la severite des symptomes. 

L'expansion des repetitions CAG/CTG peut apparaitre dans les 
regions non codantes (MD) ou codantes (par exemple SBMA et HD) des 
20 transcrits. Ces transcrits sont parfois exprimes dans les tissus autres que le 
cerveau et lorsqu'ils sont traduits conduisent a des produits de genes plus 
grands portant un domaine polyglutamine anormalement allonge (2 a 4). 

La mise en evidence d'expansion CAG/CTG dans l'ADN 
genomique de patients et/ou Panticipatton dans les families a risque a 
25 suggere que les mutations dynamiques sont impliquees dans SCA 2, SCA 4 et 
SCA 5, I'ataxie cerebrale dominante autosomale {A DC A de type 2) et la Forme 
familiale du desordre affectif bipolaire (BPAD) ou la schizophrenic. 
L'autisme et la demence familiale qui montrent des variabilites dans Page dc 
la survenue ou dans la severite des symptomes pourraient egalement Stre 
30 causes par des mutations dynamiques. 

Un assez grand nornbre de maladies pourraient egalement 
avoir pour origine ou impliquer des mutations dynamiques : 

- la maladie de Parkinson, 

- les paraplegies spastiques, 

35 - les ataxies cerebrospinal non repertoriees precedemmem, 

- les cataractes zonulaires, 
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- les tremblements incontrolables, 

- ies neuropathies amylo'tdes farniliales, 

- les arthriies granuloma reuses farniliales (maladie de Blau), 

- les microsomies hemifaciales, 

5 - certaines anemies et glaucomes, 

- les desordres obsessionnels. 

Ce qui precede demontre 1 'importance considerable des 
maladies a triplet repete et i'irnportance de leur diagnostic et de leur 
traitemeru. 

10 La presente invention repose sur une etude systematique des 

repetitions CAG/CTG (qui seront ci-apres designees par "[CAG]n", n etant le 
nombre de repetitions du triplet), cette etude ayant ete realisee avec des 
banques d'ADNc humains, celles-ci ayant subi un premier criblage general, 
puis les sequences retenues ayant ete selectionnees sur la base d'un certain 

15 nombre de criteres permettant de s'assurer que les sequences en cause 
appartenaient a de nouveaux genes humains et pouvaient, avec une grande 
probability, etre impiiquees dans des maladies a triplet repete. Enfin, les 
sequences selectionnees ont fait l'objet d'une etude plus complete destinee a 
permettre leur localisation. 

20 Dans le cadre de la presente invention, deux ensembles d'ADNc 

provenant de cerveaux humains ont ete etudies pour analyser la presence 
de repetitions CAG en utilisant I'hybridation d 'oligonucleotides sur des 
membranes a haute densite. Les deux libraries ont etc obtenues a partir de 
ARNms a 1'aide d'amorce oligo-dT, 1'une des librairies etant constiluec de 

25 clones d'ADNc de cerveau foetal (FB) et i'autrc librairie etant constiluec de 
clones d'ADNc normalises de cerveau de nouvcau-ne (NIB). 

De plus, les ESTs humains dans les banques de donnees ont ete 
analyses pour detecter la presence de triplets repetes dans les ADNc de tissus 
humains autres que ie cerveau. 

30 De facon generate, la presente invention repose sur la mise en 

evidence de certaines sequences susceptibles d'etre tmpliquees dans les 
maladies a triplet repete obtenues dans des conditions d'hybridation 
permettant de selectionner des ADNc qui contiennent un nombre de 
sequences [CAG] superieur a 9, lesquelles sont plus susceptibles d'etre 
35 polymorphes dans une population normale. 
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Les conditions completes d'anatyse er de selection de ces 
clifferentes sequences ne serom pas detaillees ci apres, seuls seront fournis 
les elements permettant de les tocaliser et de les reisoler grace, notarament, 
aux amorces PGR qui seront decrites ci-apres. 

Plus particulierement, la presente invention concerne utic 
sequence d'ADN transcrit riche en triplet repete CAG ou CTG correspondant 
aux sequences Aaldu tableau, ainsi que leurs alleles normaux et mutes et 
les sequences complementaires. 

Par "alleles normaux" on entend designer les alleles tels qu'ils 
ont ete isoles ou tels qu'il peuvent etre isoles de prelevements d'individus 
normaux, les "alleles mutes" etant les alleles des genes portant les 
sequences [CAGjn anormalement repetees. 

U est important de noter que, bien que certaines de ces 
sequences soient, totalement ou en partie, publiques, les sequences en cause 
sont pour la premiere fois identifiees comme faisant partie d'un gene 
pouvant presenter une mutation dynamique, iesdits genes n'ayant, par 
ailleurs, en eux-memes jamais ete" decrits. 

Les sequences ainsi mises en evidence presentent, notamment 
pour sept d'entre elles, un pourcentage d'hetero2ygotie {pourcentage HTZ) 
suffisamment important pour etre impliquees tres directement dans des 
maladies a triplet repete. Les sequences E et I qui presentent un tres faible 
taux d'heterozygotie (HTZ : 0,05) sont moins susceptibles d'etre impliquees 
dans de telles maladies. 

Bien entendu, comme cela est meiuionne preccdemmem, ces 
sequences sont idemifiees dans le tableau et pourront, si besoin est, etre 
reisolees en utilisant les amorces suivantes : SEQJD I a 18, les amorces 1 a 18 
correspondant, par paire, aux sequences A a 1 mentionnees precedemment. 

Les sequences ainsi mises en evidence peuvent, tout d'abord, 
etre utilisees dans le cadre du diagnostic, et plus exactement d'un pronostic. 
En effet, comme un grand nombre de maladies ayant un support genetiquc, 
la mise en evidence de la presence d'une sequence presentant un nombre 
de repetitions anormal de triplet [CAGJn ne peut en elle-meme assurer de la 
survenue de la maladie, mais doit etre interpretee en fonction d'un 
ensemble d'autres informations pour permettre, soit un diagnostic tres 
precoce, soit eventuellement une surveillance specifique, surtout dans les 
families a risque. 
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Ce diagnostic peut etre effectue en comparanc la sequence 
ci'ADN selon 1'in.vention du patient avec une sequence normale pour 
detecter la presence de repetitions trinucleotidiques supplementaires. 

Plus particulierement, la presente invention concerne un 
5 procede de mise en evidence des risques d'apparition d'unc rnaladie a 
repetition trinucteotidique chez un patient, caracterise en ce qu'on 
compare la sequence d'ADN selon la revendication 1 dudit patient a une 
sequence normale pour detecter la presence de repetitions trinucleotidiques 
supplementaires. 

10 Bien en rendu, il existe un grand nombre de methodes qui 

permettem la mise en evidence de triplets surnumeraires par rapport a des 
sequences normales, par e.xemple il est possible de rnettre en evidence des 
differences de poids moleculaires en utilisant des gels et une methode de 
type RFLP. Mais, les methodes les plus efficaces consistent a pratiquer 

15 prealablement a la mise en evidence des differences une operation 
d'arnplification, par toute methode approprtee, notamment la methode dite 
"PCR", meme si d'autres methodes sont utilisables. 

[1 n'est pas necessaire ici de decrire en detail la methode PCR, 
celle-ci permet d'amplifier de facon considerable une sequence specifique 

20 comprise entre deux sequences appelees "amorces". 

Parmi ies amorces utilisables dans le cadre des precedes selon 
I'invention, il faut citer les amorces des SEQ.ID 1 a IS qui constituent deux 
par deux des paires d'amorces pour chacunc des sequences objet de 
I'invention.. 

25 En utilisant les amorces decrkes precedemmeiu, on amplifie 

les sequences selon la presente invention et il est alors possible, par 
comparaison avec un echantillon norma! et/ou etalon, de mettre en 
evidence la presence des triplets surnumeraires et done la possibility de 
survenue d'une rnaladie liee a ce type de mutation dynamique. 

30 11 est egalement interessant de noter que ces maladies a 

mutation dynamique sont connues pour etre d'autant plus severcs et 
survenir d'autant plus tot qu'est important le nombre de repetitions. Dans 
ces conditions, la methode diagnostic peut permeitre, non seulement un bon 
pronostic de la survenue de la rnaladie, mais egalement d'evaluer le moment 

35 ou cette rnaladie surviendra et/ou son eventuelle severitc. 
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La presence invention concerne egalement les genes et leurs 
alleles qui portent, au moins en parties, ces sequences, lesdits genes etant, 
bien entendu, impliques directement dans la survenue de la maladie. 

Les genes correspondant pourront etre exprimes dans des 
cellules par des moyens ccmnus afin de produire les proteines 
correspondantes. 

II est possible d'envisager ('utilisation desdites proteines dans 
certains kits de diagnostic par exemple. 

De facon generate, ces proteines etant impliquees dans la 
maladie, on souhaitera en diminuer la quantite, soit en bloquant leur 
expression par des methodes appropriees au niveau des genes ou des 
elements de regulation, soit en les fixant ou en les inactivant, par exemple 
en utilisant des proteines receptrices jouant le role de leurres. La encore, 
ces proteines receptrices ou inactivees pourront etre generees in situ par 
expression des sequences d'ADN correspondantes. 

II est egalement possible de prevoir la realisation d'anticorps 
monoclonaux correspondant a ces proteines afin d'envisager le blocage 
desdites proteines lorsque cela est souhaite, ('ensemble de ces operations 
pouvant etre realise directement in vivo par exemple, en utilisant des 
techniques de therapie genique, en particulier en utilisant des vecteurs qui 
porteront les sequences d'expression des genes. 

On a mis en evidence le fait que les proteines presentant des 
domaines polyglutamiues anormalement etendus avaient des proprietes 
d'aggregation anorrnales, tanc entre elles, qu'avec d'autres proteines (7, 8). 
Les aggregate ainsi crees sont probablemcnt impliques dans la genese des 
maladies a tripler repete, c'est pourquoi il est egalement possible de prevoir 
une therapie dans laquelle les agents therapeutiques viendraient empecher 
('aggregation, soit en bloquant la molecule cornrne decrk precedemmem, 
soit en se fixant a la molecule pour empecher le rapprochement avec 
d'autres proteines. 

On peut, dans le cadre de la therapie, prevoir d'utiliser des 
variants complets ou deletes de ces proteines, normales ou non (quant au 
domaine [CAGjn). 

Les sequences selon la presente invention peuveiit etre 
obtenues grace aux informations figurant au tableau et aux references qui 
y sont donnees et en utilisant les sequences d'amorce qui sont decrites dans 
les identificateurs de sequence ci-joints. 
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Les deux librairies uiiiisees son: : 
mie premiere librairie (5) contenant 60 000 ADKc non normalises de 
cerveau foetal humain (clones PB) (Laboratoire du Dr. Hans Lehrach, 
Max Flank Institute for Molecular Genetics, Berlin, Allemagne) sous- 
5 clones dans le vecteur p-SPORT-i {Life Technologies, Inc., Gaithesburg, 

MA, USA), et 

la seconde librairie contient 40 128 ADNc normalises de cerveau de 
nouveau-ne (clones NIB) sous-clones dans un vecteur lafmid (6) et qui 
est une partie des ressources du consortium IMAGE (Lawrence 
10 Livermore Lab., Livermore, CA.) et du programme EST Merck WU 

(Washington University, St-Louis, LO, USA). 

D'autre part, un certain nombre d'autres informations ont etc 
recueillies en utilisant Genbank Database (NCBt Bethesda, MA, USA). 

Les methodes de selection et d'analyse qui ont 6te mises en 
15 oeuvre ne font pas en elles-memes partie de la presente invention puisque 
I'invention a essentiellement pour objet ies sequences ainsi obtenues et 
leur utilisation, notamment, dans des methodes de diagnostic ou des 
methodes de traitement therapeutique. 

Dans la presente analyse, on a retenu, non seulement les 
20 sequences polymorphiques [CAG]n parfaites, mais egalemcnt les sequences 
[CAGjn compiexes, e'est-a-dire celles qui sont ponctuees par des insertions 
de triplets ; en effet ceite presence dc triplets inseres s'observe notamment 
dans le cas de SCA 1 , alors que te! n'est pas le cas pour SBMA, MD et HD. 

L'etude presente a montre que le polyrnorphisme [CAG]n 
25 apparait lorsque la sequence (CAG)n contient plus de 9 copies CAG (n > 9) ; 
e'est pourquoi, dans les selections effectuees, les conditions de stringence 
sont assez elevees, ce qui a permis de selectionner rapidement un grand 
nombre de sequences [CAG]n dans lesquelles n est superieur a 9- D'ailleurs, 
les sequences [CAGJn dans lesquelles n est inferieur a 10 et qui ont pu etrc 
30 testees dans le cadre de la presente invention om montre un 
polyrnorphisme nul. 

Par contre, il n'est pas possible de relever une correlation 
directe entre la longueur des sequences [CAG]n et le degre de 
polyrnorphisme. 
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Librairies NIB sont distincts de ceux selectionnes dans le groupe FB. Ceci est 
en accord avec le fait que le cerveau humain exprime un grand nombre de 
genes discincts a des stades de developpement differents. 
5 Enfin, des presentes observations il ressorr que des sequences 

[CAG]n superieures a 9 sont rares ( 1 pour 2 200 ) 1 pour 3 000) dans les ADNc 
humains representatifs des regions 3' des ARNm. 

Bien que dans l'etat actuel de la presente invention, ies 
sequences qui constituent 1'objet de 1'invention n'aient pas ere reliees 
10 • directement a des affections neurologiques hereditaires, la presence 
d'excenstons anormales CAG peut etre reliee avec le risque de survenuc 
d'une maladie neurologique, en particulier lorsqu'il y a une composante- 
familiale. 

Sauf pour le clone 2.L16 qui est localise sur le chromosome 
15 3pl4 et peut-£tre irnplique dans ADCA 11, les amres sequences hautement 
polymorphiques [CAGJn decrites precedernment ne correspondent a aucun 
locus connu pour des maladies neurologiques hereditaires. II a etc trouve 
que ce clone 2.116 correspondait a un transcrit de 2 227 paires de base 
hautement exprime dans les muscles squeletriques et faiblement exprime 
20 dans le cerveau d'apres ['analyse Northern Blot. La repetition des sequences 
CAG polymorphiques est localisee au niveau de la region 3' non traduite de 
1'ARNm. L'ARNm correspondant au clone 2.116 code pour une proidine 
putative de 137 acides amines (nt 127 a 538) ne prcscntant aucunc 
homologie avec des proteines co.nnues dans Genbank. 
25 La sequence complete du transcrit du clone 2.116 est 

representee par SEQ.ID 19. 

Neanmoins, it existe un assez grand nombre de maladies 
neurologiques qui actuellement n'ont pas ete localisees et trouveront 
probablement a etre reliees avec les sequences selon la presente invention. 
30 Parmi les elements additionnels qui one ete prts en compte 

pour etudier la pertinence des sequences revenues figure l'existence 
eventuelle d'un cadre de lecture ouvert (ORF-) dans lequel les sequences 
[CAG)n codent pour une extension polyglutamine. 

Enfin, la presente etude suggere que la frequence du 
35 polymorphisme [CAGJn est un evenement rare dans les ADNc humains 
representatifs des regions 3' des ARNm. 
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USTEPE SEQUENCES 

(1) INFORMATIONS GENERA LES 
(0 DEPOSANT: 

(A) NOM : FOND ATI ON JEAN DAUSSET - CENTRE D'ETUDE DU 

POLY MO RPH ISM E I1UMAIN (CEPH). 

(B) RUE : 27 Rue Juliette Dodu 

(C) VILLE : PARIS 

(D) PAYS : FRANCE 

(E) CODE POSTAL : 75010 

(ii) TITRE DE L" INVENTION : DIAGNOSTIC DES MALADIES A REPETITION 

TRINUCLEOTIDIQUE ET GENES IMPLIQUES 
DANS CES MALADIES 

(iii) NOMBRE DE SEQUENCES : IS 

(tv) FORME DECHIFFRABLE PAR ORDINATEUR : 

(A) TYPE DE SUPPORT : Floppy disk 

(B) ORDINATEUR : MACINTOSH APPLE 

(C) SYSTEM E D' EXPLOITATION : MAC-OS SYSTEM E 7 

(D) LOGICIEL: WORDPERFECT 

{ v) DONNEES DE LA DEMANDE ACTUELLE : 
NUMERO DE LA DEMANDE : 

(2) INFORMATIONS POUR LA SEQ.ID NO 1 : 

. (i) C ARACTERISTIQU ES DE LA SEQUENCE: 

(A) LONGUEUR : 1 5 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 
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(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORT EUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 2. 1 16 

5 (C) ORIGINE : Max Plank Institute for Molecular Genetics 

Laboratory of Dr Hans Lehrach, Berlin, Alicmagne. 
(D) NOM DU CLONE DANS LA BANOJJE D'ORiGINE :ICRFp507E07266 

(iv) DESCRIPTION DE LA SEQUENCE : 

10 

CCAGCCTCAC GTACC 15 



(2) INFORMATIONS POUR 1A SEQ.ID NO 2 : 

15 (t) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 22 nucleotides 

(B) TYPE : nucleotide 

(C) NOM B RE DE BRIN : simple 

(D) CONFIGURATION : lineaire 

20 

(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

25 (A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 2.1 16 

(C) ORIGINE : Max Plank institute for Molecular Genetics, 

Laboratory of Dr Hans Lehrach, Berlin, Allemagne 

(D) NOM DU CLONE DANS LA BANOJJE D'ORIGINE :ICRPp507E07266 

30 

(iv) DESCRIPTION DE LA SEQUENCE : 

GTACTGAGGG Cl'I TITAGAT TC 22 



35 
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(2) INFORMATIONS POUR LA SEQID NO 3 : 



(t) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 18 nucleotides 

(B) TYPE : nucleotide 

(Q NOMBRE DE BRIN : simple 
(D) CONFIGURATION : lindaire 



(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LP. DEPOSANT : 2.1 19 

<C) ORIGINE : Max Plank Institute for Molecular Genetics, 

Laboratory of Dr Hans Lehrach, Berlin, Allemagne 
(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE :ICRFp507J 10268 

(iv) DESCRIPTION DE LA SEQUENCE : 

TCATGCAGCA GAAAACAG 1& 



(2) INFORMATIONS POUR LA SEQ.ID NO 4 : 

25 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 18 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineatre 

30 

(ii) TYPE DE MOLECULE : ADNc 



35 



(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 
MOLECULE : 
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(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 

(C) ORICfNE : Max Plank Institute for Molecular Genetics, 

Laboratory of Dr Hans Lehrach, Berlin, AUemagne 

(D) NOM DU CLONE DANS LA BANQ.UE D'ORIGINE :lCRl : p507J 1026S 

(iv) DESCRIPTION DE LA SEQUENCE : 

AAAGGGGAGA CCAATTTG IS 

(2) INFORMATIONS POUR LA SEQJD NO 5 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 18 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : tineaire 

(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DGPOSANT : 2.70 

(C) ORIGINE : Max Plank Institute for Molecular Genetics, 

Laboratory of Dr Hans Lehrach, Berlin, Allernagne 

(D) NOM DU CLONE DANS LA BANOJJE D , ORIGINE:ICRFp507K242 I 2 

(iv) DESCRIPTION DE LA SEQUENCE : 

GCACAGTCCT CACTAAAC 18 
(2) INFORMATIONS POUR LA SEQ.ID NO 6 : 



35 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 19 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineatre 



(ii) TYPE DE MOLECULE : ADNc 



20 



(lit) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 
MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 2.70 

(C) ORIGINE : Max Plank Institute for Molecular Genetics. 

Laboratory of Dr Hans Lehrach, Berlin, Allemagne 

(D) NOM DU CLONE DANS LA BANQUE D'OR!GlNEICRFp507K242 1 2 

(tv) DESCRIPTION DE LA SEQUENCE : 

GGACATTGGC TTCAACTTC 19 
(2) INFORMATIONS TOUR LA SEQ.ID NO 7: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR : 16 nucleotides 
25 (B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE : ADNc 

30 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 2.81 

35 (C) ORIGINE : Max Plank Institute for Molecular Genetics, 

Laboratory of Dr Hans Lehrach, Berlin, Allemagne 
(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE : ICRFp507 10522 
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(iv) DESCRIPTION DE LA SEQUENCE : 

CAGGTGCAGC GTCAAA 16 
5 (2) INFORMATIONS POUR 1A SEQ.ID NO 8 : 

(i) CARACTERISTIOJJES DE LA SEQUENCE: 

(A) LONGUEUR : 16 nucleotides 

(B) TYPE : nucleotide 

10 (C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineaire 

(it) TYPE DE MOLECULE : ADNc 

15 (iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE -. 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 2.81 

(C) ORIG1NE : Max Plank Institute for Molecular Genetics, 
20 Laboratory of Dr Hans Lehrach, Berlin, Ailemagne 

(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE :ICRFp507I05222 

(iv) DESCRIPTION DE LA SEQUENCE : 

25 GGAGGAGGTG TCACAG 1G 

(2) INFORMATIONS POUR LA SEOJD NO 9 : 

(t) CARACTERISTIQUES DE LA SEQUENCE: 
30 (A) LONGUEUR : 19 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineaire 



35 



(ii) TYPE DE MOLECULE : ADNc 
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(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : i.S 

(C) ORIGINE : Reseau I.M.A.G.E., Lawrence Livermore National 

Laboratories, Livermore, CA, USA. 

(D) NOM DU CLONE DANS LA BANOJJE D'ORJGINE : 30262 

(iv) DESCRIPTION DE LA SEQUENCE : 

GATAAAAGGA AGGGAAAAG 19 
(2) INFORMATIONS POUR LA SEQ1D NO 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 17 nucleotides 

(B) TYPE : nucleotide 

(C) NOM B RE DE BRIN : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR Dl: LA 

MOLECULE: 

(A) TYPE DE CELLULE : bacierie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : L8 

(C) ORIGINE : Reseau I.M.A.G.E.. Lawrence Livermore National 

Laboratories, Livermore, CA, USA. 

(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE : 30262 

(iv) DESCRIPTION DE LA SEQUENCE : 

GCAACACTCA GAAATGG 17 



35 
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(2) INFORMATIONS POUR LA SEQ.ID NO 1 1 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 19 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : liaeaire 

(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacrerie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : i. 1 80 

(C) ORIGINE : Reseau I.M.A.G-E, Lawrence Livermore National 

Laboratories. Livermore. CA, USA. 

(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE : 153781 ou 
162267 

(iv) DESCRIPTION DE LA SEQUENCE : 

AAGTCAGAGT TACTCTTGC 19 
(2) INFORMATIONS POUR LA SEQID NO 12 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 17 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineaire 



(ii) TYPE DE MOLECULE : ADNc 
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(iii) CARACTERISTIOJJES DU CLONE CELLULAIRE PORTED R DE LA 
MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : i. ISO 

5 (C) ORIGIN E : Reseau I.M.A.G.E, Lawrence Livermore National 

laboratories, livermore, CA, USA. 
(D) NOM DU CLONE DANS LA BANQUE D'ORIGiNE : 153781 ou 
162267 

10 (iv) DESCRIPTION DE LA SEQUENCE : 

GAGTGAACTT CAGGAGG 17 
(2) INFORMATIONS POUR LA SEQ.ID NO 13 : 

15 

(i) CARACTERJSTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 19 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 
20 (D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIOJJES DU CLONE CELLULAIRE PORTEUR DE LA 
25 MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : i. 1 S 1 

{Q ORIGINE : Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 
30 (D) NOM DU CLONE DANS LA BANQUE D'ORIGINE : 1 14128 

(iv) DESCRIPTION DE LA SEQUENCE : 



35 



OGACAAAGCT ACATGTCAG 



1.9 
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(2) INFORMATIONS POUR LA SEQID NO 14 : 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR : 16 nucleotides 
5 (B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineaire 



(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORT EUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : i. 1 8 1 

(C) ORIGINE : Reseau LM.A.G.E., Lawrence Livermore National 

Laboratories, Livermore, CA, USA- 

(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE : 1 1412S 

(iv) DESCRIPTION DE LA SEQUENCE : 

GGTGAGTGTC CTTCTG ig 



(2) INFORMATIONS POUR LA SEQID NO 15 : 

25 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 15 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineaire 

30 

(ii) TYPE DE MOLECULE : ADNc 



(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 
MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : i. 1 82 
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(C) ORIG1NE : Reseau [.M.A.G.E., Lawrence Livermore National 

Laboratories, Livermore, CA, USA. 

(D) NOM DU CLONE DANS LA BANQOE D'ORIGINE : 67444 

(iv) DESCRIPTION DE LA SEQUENCE : 

GGGCTAAGCC GAAAG 15 
(2) INFORMATIONS POUR LA SEQ.ID NO 16 : 

(i) CARACTE11ESTIQ.UES DE LA SEQUENCE: 

(A) LONGUEUR : 15 nucleotides 

(B) TYPE : nucleotide 

(C) NO MB RE DE BRIN : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTERISTIQUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : i. 1 82 

(C) ORIGINE : Reseau I.M.A.G.E., Lawrence Livermore National 

Laboratories, Livermore, CA, USA- 

(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE: 67444 

(tv) DESCRIPTION DE LA SEQUENCE : 

CTTGGTGGGC AAGTG 15 
(2) INFORMATIONS POUR LA SEQID NO 17 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 18 nucleotides 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN : simple 

(D) CONFIGURATION : lineaire 
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(ii) TYPE DE MOLECULE : ADNc 

(iii) CARACTER1STIQ.UES DU CLONE CELLULAIRE PORT EUR DE LA 

MOLECULE : 

5 (A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 2.46 

(C) OR1GINE : Max Plank Institute for molecular Genetics, 

Laboratory of Dr Hans Lehrach, Berlin, Allemagne. 

(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE :!CIlFp507E06174 

10 

(iv) DESCRIPTION DE LA SEQUENCE : 

TTTTTACTCG CGCCGGTG IS 
15 (2)1 INFORMATIONS POUR LA SEQ. ID NO 1 8 : 

(i) CARACTERIST1QUES DE LA SEQUENCE: 

(A) LONGUEUR : 25 nucleotides 
<B> TYPE : nucleotide 
20 (C) NOMBRE DE BR1N : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE : ADNc 

25 (iii) CARACTERIST1QUES DU CLONE CELLULAIRE PORTEUR DE LA 

MOLECULE : 

(A) TYPE DE CELLULE : bacterie 

(B) NOM DU CLONE D'ADNc CHEZ LE DEPOSANT : 2.46 

(C) ORIGINE : Max Plank Institute for molecular Genetics, 
30 Laboratory of Dr Hans Lehrach, Berlin, Allemagne. 

(D) NOM DU CLONE DANS LA BANQUE D'ORIGINE :ICRfp507E06l74 

(iv) DESCRIPTION DE LA SEQUENCE : 



35 



CAGGATAATC AAGAATGAAG TTAAG 



25 
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(2) INFORMATIONS POUR LA SEQ ID NO: 19: 



5 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2227 nucleotides 

(B) TYPE: nucleotide 

(C) NOMBRJE DE BRJNS: simple 

(D) CONFIGURATION: Jineaire 

10 

(ii) TYPE DE MOLECULE: ADNc 

(ix) CARACTERISTIQUE: 
(A) NOM/CLE:2.1 16 
15 (B) EMPLACEMENT.-chromosome 3pl4 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

gccogaagrcggggtgtgaagcC5?cg^tgctg^cgcggcgg^gg,^ct§cg / §fgggca^cc.|c 

aggtagca'gcagciigcagcagclgcagckgcagc'Sgcagcagcdgc'agcagcagcagciag Cft fr 

cagcagcaatgcttcactccttcagaaagcctccggaacccaaaaagccc tea g caeca g 

agaeagaagfcagatggattcgtccttttaggagatacaacagatgagcaaagaacgacag 

caagaggcaaaacttcggacatagaggccaaccaacccttggagaecaaeaaagaaaacc 

catccagcgtgactgtatcagaccctgagacggaaaataaggcaggccagactctggaga 

acagctcactaatggccgagctcctgaacgatgtgccgttcaccctggccccgcatgtgc 

tggcagcacagggcaccatcactgaccctcccgaccacttaccctcccatgatggcagcg 

aaaacttatcacggttceggeacgattccactcttgaaaatccagtgcceegtgattcac 

aacctttacgcctgtccgcaccctaacagccctaaaacatgcccgcctaccccacccaac 

ctgtntgacgttcttcgccgtttcactgtttaaggtcctcagcaaggatcacaaagcaaa 

gaaaatagcactatgctcaccactctacttttaagaaaaaggtacatctgcacacaaatt 

gaacctaagttccaccccctctcccccatataataaatatacaaattaggccacgaaggt 

tctaggaaaggactcgacccccccagatggtccctcaaaacacaacacctcaaatttacc 

ttagaagaactgtgaaaaagaattgtggcactcttcagecaccacagccccgaagcctga 

gcaagaagtgggugtgaagt-ctccccCctggtctgtaggaagLtgaatcagcgctactcc 

tgcacttttttcctccacagtgtttatgaatgaattcagaaaaaaagttgccagttagct 

taatttcttcagacgcattgatgtggaatttaaaacttgtcctaaacagcagtgctagtc 

tgctgatacaaggatgccagacctgccctgcgcgctccctctggagtggcccaccccggt 

tctccgaaacccatggcagccctttccatcgegaataatcgccgcgctcccaccttcgct: 

ctctgcctttttgctactecagtgtgctctctgaccagcttcccaaagaactctccctgc 

tcctgcctcggttgccattcgctctccttaccacatatgttcccagtttacgaagagacc 

cacatttcctttcaaccccectgcctccegaagaaaaacatctcatgatgatacatatta 

ttgctgataacacccttatttagaaatttgttggccacaatacagaeggaaacgttetac 

CgctggaaaaaccgaaaccaactcatttccaatCagagcacaggcagaacacccagatat 

gactcttagttcttgaatatccaetacctactttaatgaaaacagaaccgccatcggcca 

ataaactgcaaagggaagaggtaaattgtgatagagaattttctatgtcatgggaaattg 

aaatcacattcacttcgattaccagcaacacgatccattaactccgtgccaagttttaag 

catattttcccacaaagatagagtgccatagtgaaaceaaacactgcgcacaaaggtaca 

cgaattactccagttttaaagtattatgcatgcccgtctaataaatgtggcatggctcca 

atacaaatgctatgttatttaaaagtcagaggaacatttctaetgacaaaaaeatgcttc 

atttacacataatgccaccacacggcgctaatgatcaaactagaccttcacacagctccc 

acaaagcatcagtctaggaaatatgacctattactgatgcaaatgtgaacacttcgtagt 

agtcttgtaaaagaacaccctccccaaatatctacgccaatgtacccccgaaactaaacg 

caagcacacagtcagtttgtctaatcttgcgcgaaatttcgccgaaaacacccaaacac:: 

Ccatcuatatttgtgcctaccatgtttacaaatgttccataagcacctcccatgttgttc 

tacaaaaaatgttatacctaaataaatgtgaatcaaaacaaaatccttgactattctccg 

atccccg 
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REV INDICATIONS 



1) Sequence d'ADN transcrit riche en triplet repete CAG ou CTG 
coriespondant aux sequences A a I selon ie tableau ainsi que leurs alleles 

5 normaux et mutes et les sequences complementaires. 

2) Gene humain et ses alleles, caracterise en ce qu'ii porte au 
moins en partie une sequence selon la revendication 1. 

3) Precede" de mise en evidence des risques d'apparition d'une 
maladie a repetition trinucleotidique chez un patient, caracterise en ce 

10 qu'on compare la sequence d'ADN selon la revendication I dudit patient a 
une sequence normale pour detecter la presence de repetitions 
trinucleotidiques suppldrnentaires. 

4) Procede selon la revendication 3, caracterise en ce qu'on 
effectue une amplification de tout ou partie des sequences seion la 

15 revendication 1 et que Ton met en evidence dans le produit d'ampfification 
la presence de repetitions trinucleotidiques supplementaires. 

5) Procede selon la revendication 4, caracterise en ce que 
I'amplification des sequences est effectuee avec les amorces decrites SHQ, ID 
1 a 18 correspondant aux sequences A a I respectivement. 

20 6) Cellule transformed exprimant tout ou partie d'un gene 

selon la revendication 2. 

7) Protdine obtenue a partir d'une cellule transformed selon la 
revendication 6. 

8) Proteine interagissant avec une proteine selon la 
25 revendication 7. 

9) Anticorps monoclonal correspondant a une proteine selon 
l'une des revendications 7 ou 8. 

10) Vecteur exprimant une proteine selon l'une des 
revendications 7 ou 8. 

30 11) Utilisation therapeutique d'une proteine selon l'une des 

revendications 7 ou 8, d'un anticorps s n la revendication 9 ou d'un 
vecteur selon la revendication 10. 



